AI资讯新闻榜单内容搜索-OpenAI o1

OpenAI o1强推理能提升安全性？长对话诱导干翻o1

最近，以 OpenAI o1 为代表的 AI 大模型的推理能力得到了极大提升，在代码、数学的评估上取得了令人惊讶的效果。OpenAI 声称，推理可以让模型更好的遵守安全政策，是提升模型安全的新路径。

来自主题: AI技术研报

3431 点击 2024-11-07 18:17

Llama版o1来了，来自上海AI Lab，强化学习代码已开源，基于AlphaGo Zero范式

复刻OpenAI o1推理大模型，开源界传来最新进展： LLaMA版o1项目刚刚发布，来自上海AI Lab团队。

来自主题: AI技术研报

3963 点击 2024-11-05 15:12

慢思考准确率反降30%！普林斯顿揭示思维链某些任务上失效的秘密

OpenAI o1彻底带火慢思考和思维链（CoT）方法，但CoT在某些任务上反而会降低模型表现。

来自主题: AI技术研报

4164 点击 2024-11-05 09:33

对标Hugging Face？GitHub Models新增OpenAI o1/Llama 3.2等，新功能支持模型并排比较

北京时间 10 月 30 日，GitHub Universe 2024 如约而至，而今年正值大会十周年纪念日。本文将从 GitHub 发布的 AI 新进展入手，围绕开源模型、用户数量、盈利模式、发展历程等几个方面，全面梳理 GitHub 与 Hugging Face 两大开源平台的异同。

来自主题: AI资讯

4432 点击 2024-10-30 09:28

与OpenAI o1技术理念相似，TDPO-R算法有效缓解奖励过优化问题

OpenAI 最近发布的 o1 模型在数学、代码生成和长程规划等复杂任务上取得了突破性进展，据业内人士分析披露，其关键技术在于基于强化学习的搜索与学习机制。通过迭代式的自举过程，o1 基于现有大语言模型的强大推理能力，生成合理的推理过程，并将这些推理融入到其强化学习训练过程中。

来自主题: AI技术研报

9414 点击 2024-10-26 17:01

大模型步入「推理Scaling」时代，SambaNova如何挑战英伟达的霸主地位？

OpenAI o1 的发布，再次给 AI 领域带来了一场地震。 o1 能像人类一样「思考」复杂问题，拥有优秀的通用推理能力。在未经专门训练的情况下，o1 能够直接拿下数学奥赛金牌，甚至能在博士级别的科学问答环节上超越人类专家。

来自主题: AI资讯

3465 点击 2024-10-18 13:43

英伟达开源最新大模型Nemotron 70B后，只有OpenAI o1一个对手了

英伟达不仅要做显卡领域的领先者，还要在大模型领域逐渐建立起自己的优势。

来自主题: AI资讯

9558 点击 2024-10-18 10:42

英伟达开源新王登基！70B刷爆SOTA，击败GPT-4o只服OpenAI o1

英伟达开源了超强模型Nemotron-70B，后者一经发布就超越了GPT-4o和Claude 3.5 Sonnet，仅次于OpenAI o1！AI社区惊呼：新的开源王者又来了？业内直呼：用Llama 3.1训出小模型吊打GPT-4o，简直是神来之笔！

来自主题: AI技术研报

3422 点击 2024-10-17 15:51

Evaluation is All You Need！首个开源多模态大模型通用评测器LLaVA-Critic

随着对现有互联网数据的预训练逐渐成熟，研究的探索空间正由预训练转向后期训练（Post-training），OpenAI o1 的发布正彰显了这一点。

来自主题: AI技术研报

4183 点击 2024-10-14 15:46

唯一答对“strawberry中有几个r”的开源项目，被我找到了！

OpenAI o1团队花了半年时间教会o1 "strawberry中有几个r"，一个开源项目做对了！

来自主题: AI资讯

3803 点击 2024-10-11 10:24

AI资讯新闻榜单内容搜索-OpenAI o1

OpenAI o1强推理能提升安全性？长对话诱导干翻o1

Llama版o1来了，来自上海AI Lab，强化学习代码已开源，基于AlphaGo Zero范式

慢思考准确率反降30%！普林斯顿揭示思维链某些任务上失效的秘密

对标Hugging Face？GitHub Models新增OpenAI o1/Llama 3.2等， 新功能支持模型并排比较

与OpenAI o1技术理念相似，TDPO-R算法有效缓解奖励过优化问题

大模型步入「推理Scaling」时代，SambaNova如何挑战英伟达的霸主地位？

英伟达开源最新大模型Nemotron 70B后，只有OpenAI o1一个对手了

英伟达开源新王登基！70B刷爆SOTA，击败GPT-4o只服OpenAI o1

Evaluation is All You Need！首个开源多模态大模型通用评测器LLaVA-Critic

唯一答对“strawberry中有几个r”的开源项目，被我找到了！

对标Hugging Face？GitHub Models新增OpenAI o1/Llama 3.2等，新功能支持模型并排比较